
%!TEX program = xelatex
%!TEX TS-program = xelatex
%!TEX encoding = UTF-8 Unicode

\documentclass[10pt]{article} 

\input{wang_preamble.tex}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\usepackage{titling}
\setlength{\droptitle}{-2cm}   % This is your set screw

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%文档的题目、作者与日期
%%\author{王立庆（2019级数学与应用数学1班）}
%\author{学号 \underline{\hspace{4cm}}\,\,\,\, 姓名 \underline{\hspace{4cm}}  }
%%\title{高等代数第六章：向量空间}
%\title{统计软件考试解答 }
%%\date{\vspace{-3ex}}
%\renewcommand{\today}{\number\year \,年 \number\month \,月 \number\day \,日}
%\date{2023年4月24日}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

\begin{document}

%\maketitle

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

\begin{center}

{\Large\bf \H 上海立信会计金融学院期终考试卷 } \hspace{0.3cm} {\Large \underline{ B }卷 解答}

\vspace{0.3cm}

{\large \bf \H 2023 $\sim$ 2024 学年 第 二 学期 }

\vspace{0.3cm}

{\large \bf \H \underline{ \emph{2021级数学与应用数学专业} } 《\underline{ \emph{多元统计分析} }》 课程代码：\underline{ 160290220 }  }

\end{center}

\vspace{0.3cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\begin{enumerate}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %1 第二章：随机向量：第46页：习题2.9 
设随机向量 $x=(x_1,x_2,\cdots,x_p)^t$ 的均值向量和协方差矩阵分别为 $\mu$ 和 $\Sigma$. 
证明 $E(xx^t) = \Sigma + \mu\mu^t$.  

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]
\item  按照协方差矩阵的定义， $\Sigma = E[(x-\mu)(x-\mu)^t]. $
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})

\item  根据数学期望的线性性质，计算上式右边可得 
\dotfill (\underline{\hspace{0.2cm} 5分 \hspace{0.2cm}})
\begin{equation*}
\begin{aligned}
\Sigma &= E(xx^t - \mu x^t - x\mu^t + \mu\mu^t) \\ 
&= E(xx^t) - \mu E(x^t) - E(x)\mu^t + \mu\mu^t \\ 
&= E(xx^t) - \mu\mu^t - \mu\mu^t + \mu\mu^t \\ 
&= E(xx^t) - \mu\mu^t. 
\end{aligned}
\end{equation*}

\item  移项可得 $E(xx^t) = \Sigma + \mu\mu^t$. 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\end{enumerate}

}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %2 第三章：多元正态分布：3.2. 多元正态分布的性质：第52页：例子3.2.3. 
设 $x=(x_1,x_2)^t \sim N_2(\mu, \Sigma)$,  设 $a=(a_1,a_2)^t$ 是常数向量，求 $y=a^tx$ 的分布。

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]
\item  因为多元正态分布的线性变换仍是正态分布，所以 $a^tx$ 服从正态分布。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  根据数学期望的线性性质，可得 $E(a^tx) = a^tE(x)=a^t\mu$. 
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})

\item  根据协方差的线性性质，可得方差为
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})
\begin{equation*}
\begin{aligned}
D(a^tx) &= \mathrm{cov}(a^tx,a^tx) \\ 
&= \mathrm{cov}(a^tx, x^ta) \\ 
&= a^t\mathrm{cov}(x,x^t)a \\ 
&= a^t\Sigma a. 
\end{aligned}
\end{equation*}

\item  因此 $a^tx$ 服从正态分布 $N(a^t\mu, a^t\Sigma a)$. 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\end{enumerate}

}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %3 第三章：多元正态分布：3.4. 复相关系数和偏相关系数：第63页：最优线性预测
用随机向量 $x$ 的函数 $g(x)$ 来预测随机变量 $y$ 时，可用均方误差 $E[y-g(x)]^2$ 
作为预测精度的度量。如果限制 $g(x)$ 为线性函数，则使得均方误差达到最小的线性预测函数是什么？ 
最优线性预测的均方误差是什么？

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]
\item  记 $\mu_x$ 和 $\mu_y$ 分别是 $x$ 和 $y$ 的均值。
\item  记 $\sigma_{xy}$ 是 $x$ 和 $y$ 的协方差，记 $\Sigma_{xx}$ 是 $x$ 的协方差矩阵。
\item  使得均方误差达到最小的线性预测函数是 $ \tilde{y} = \mu_y + \sigma_{xy}^t\Sigma_{xx}^{-1}(x-\mu_x). $
\dotfill (\underline{\hspace{0.2cm} 4分 \hspace{0.2cm}})

\item  设 $g(x) = a + b^t(x-\mu_x)$ 是任意一个线性函数，要证明 $ E[y-g(x)]^2 \ge E(y-\tilde{y})^2. $
\item  计算可得 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})
\begin{equation*}
\begin{aligned}
E[y-g(x)]^2 &= E[y-\tilde{y} + \tilde{y}-g(x)]^2 \\
&= E(y-\tilde{y})^2 + E[\tilde{y}-g(x)]^2 + 2E(y-\tilde{y})[\tilde{y}-g(x)] \\ 
&= E(y-\tilde{y})^2 + E[\tilde{y}-g(x)]^2. 
\end{aligned}
\end{equation*}

\item  因此当 $g(x)=\tilde{y}$ 时，均方误差 $E[y-g(x)]^2$ 达到最小。

\item  最优线性预测的均方误差是 
$E(y-\tilde{y})^2=\sigma_{yy} - \sigma_{xy}^t\Sigma_{xx}^{-1}\sigma_{xy}$. 
\dotfill (\underline{\hspace{0.2cm} 4分 \hspace{0.2cm}})

\end{enumerate}


}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %4 第三章：多元正态分布：3.5. 样本均值和样本协方差矩阵的抽样分布：第69页
写出自由度为 $n$ 的 $p$ 阶 Wishart 分布的定义。并解释 Wishart 分布与 $\chi^2$ 分布的关系。

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]
\item  设随机向量 $x_1,x_2,\cdots,x_n$ 独立同分布于 $N_p(0,\Sigma)$, 其中 $\Sigma>0, n\ge p$. 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  定义统计量 $W=x_1x_1^t + x_2x_2^t + \cdots + x_nx_n^t$, 这是一个 $p\times p$ 阶的随机矩阵。
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})

\item  称随机矩阵 $W$ 服从自由度为 $n$ 的 $p$ 阶 Wishart 分布，记为 $W_p(n,\Sigma)$. 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  当 $p=1$ 时，若 $\Sigma=\sigma^2=1$, 则 $W$ 是 $n$ 的相互独立的标准正态分布的随机变量的平方和，因此这时 $W$ 服从自由度为 $n$ 的卡方分布，即有 $W_1(n,1)=\chi^2(n)$. 
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})

\end{enumerate}

}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %5 第四章：多元正态总体的统计推断：4.3. 两个总体均值的比较推断：第98页：成对试验的T^2统计量
设 $(x_i,y_i), i=1,2,\cdots,n$ 是成对试验的数据，令 $d_i=x_i-y_i$, 又设 $d_1,d_2,\cdots,d_n$ 独立同分布于 $N_p(\delta,\Sigma)$, 其中 $\Sigma>0$, $\delta=\mu_1-\mu_2$ 是总体 $x$ 和 $y$ 的均值向量的差。
考虑假设检验 $$H_0: \delta=0, \,\,v.s.\,\, H_1:\delta\neq 0. $$
写出检验统计量和拒绝规则。 

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]
\item  记 $\bar{d} = \bar{x} - \bar{y}$ 是成对数据的样本差的均值。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  记样本差的协方差矩阵为 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})
$$ S_d = \frac{1}{n-1}\sum\limits_{i=1}^n (d_i-\bar{d})(d_i-\bar{d})^t. $$
 
\item  取下述检验统计量，这是一个没有量纲的随机变量， 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})
$$T^2=\bar{d}^t \left( \frac{1}{n}S_d \right)^{-1}\bar{d}. $$

\item  当原假设 $H_0: \delta=0$ 为真时，$T^2$ 的一个倍数服从 F-分布，具体有
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

$$\frac{n-p}{p(n-1)}T^2 \sim F(p,n-p). $$
\item  对给定的显著性水平 $\alpha$, 当
 $$\frac{n-p}{p(n-1)}T_2 \ge F_\alpha(p,n-p)$$
成立时，拒绝原假设。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\end{enumerate}


}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %6 第四章：多元正态总体的统计推断：第112页：4.7.总体相关系数的推断
设多元正态总体 $\vec{x}\sim N_p(\mu,\Sigma)$, $\Sigma>0$, 设 $\vec{x}_1,\vec{x}_2,\cdots,\vec{x}_n$ 是从总体 $x$ 中抽取的一个简单随机样本。设 $\vec{x}=(x_1,\cdots,x_p)^t$. 记 $\rho_{ij}=\rho(x_i,x_j)$ 是总体相关系数。考虑假设检验
$$H_0: \rho_{ij}=0, \,\,\mathrm{vs.}\,\, H_1: \rho_{ij}\neq 0. $$
写出检验统计量和拒绝规则。

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]
\item  样本协方差矩阵为 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})
$$S=\frac{1}{n-1}\sum\limits_{i=1}^{n} (x_i-\bar{x})(x_i-\bar{x})^t = (s_{ij})_{p\times p}.  $$

\item  随机变量 $x_i,x_j$ 的样本相关系数为 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})
$$ r_{ij} = \frac{s_{ij}}{\sqrt{s_{ii}}\sqrt{s_{jj}}}. $$

\item  构造统计量 
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})
$$t= \frac{\sqrt{n-2}r_{ij}}{\sqrt{1-r_{ij}^2}},$$
在原假设 $H_0:\rho_{ij}=0$ 成立的前提下，这个统计量服从自由度为 $n-2$ 的 $t$ 分布。

\item  对给定的显著性水平 $\alpha$, 当
$$ \frac{ \sqrt{n-2} | r_{ij} | } {\sqrt{1-r_{ij}^2}}\ge t_{\alpha/2}(n-2) $$
成立时，拒绝原假设。
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})

\end{enumerate}

}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %7 第五章：判别分析：第172页：习题5.2
设对来自组 $\pi_1$ 和组 $\pi_2$ 的两个样本有 
$$
\bar{x}_1=\begin{pmatrix} 5 \\ 3 \end{pmatrix}, \,\,\, 
\bar{x}_2=\begin{pmatrix} 3 \\ 1 \end{pmatrix}, \,\,\, 
S_p=\begin{pmatrix} 5 & 2 \\ 2 & 4 \end{pmatrix}, 
$$
设 $\Sigma_1=\Sigma_2$, 试给出距离判别规则，并将 $x_0=(3,3)^t$ 分到组 $\pi_1$ 或 $\pi_2$. 

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]
\item  使用判别函数 $\hat{W}(x) = \hat{a}^t(x-\bar{x})$, 其中 $\bar{x}=\frac{1}{2}(\bar{x}_1+\bar{x}_2)$, 
$\hat{a} = S_p^{-1}(\bar{x}_1-\bar{x}_2)$. 
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})

\item  判别规则为当 $\hat{W}(x)\ge 0$ 时，$x$ 属于第一组，否则属于第二组。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  代入数据计算可得 
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})
\begin{equation*}
\begin{aligned}
\bar{x} &=\frac{1}{2}(\bar{x}_1+\bar{x}_2)= \begin{pmatrix} 4 \\ 2 \end{pmatrix}, \\ 
S_p^{-1} &= \begin{pmatrix} 5 & 2 \\ 2 & 4 \end{pmatrix}^{-1} = \frac{1}{16}\begin{pmatrix} 4 & -2 \\ -2 & 5 \end{pmatrix}, \\ 
\hat{a} &= S_p^{-1}(\bar{x}_1-\bar{x}_2)= \frac{1}{16}\begin{pmatrix} 4 & -2 \\ -2 & 5 \end{pmatrix}\begin{pmatrix} 2 \\ 2 \end{pmatrix}
= \frac{1}{16}\begin{pmatrix} 4 \\ 6 \end{pmatrix} = \frac{1}{8}\begin{pmatrix} 2 & 3 \end{pmatrix}, \\
\hat{W}(x) &= \hat{a}^t(x-\bar{x}) = \frac{1}{8}\begin{pmatrix} 2 & 3 \end{pmatrix}
\left( x - \begin{pmatrix} 4 \\ 2 \end{pmatrix} \right)
\end{aligned}
\end{equation*}

\item  将 $x_0=(3,3)^t$ 代入未分组数据，可得 
$$
\hat{W}(x_0)
=\frac{1}{8}\begin{pmatrix} 2 & 3 \end{pmatrix}
\left( \begin{pmatrix} 3 \\ 3 \end{pmatrix}  - \begin{pmatrix} 4 \\ 2 \end{pmatrix} \right)
=\frac{1}{8}\begin{pmatrix} 2 & 3 \end{pmatrix}\begin{pmatrix} -1 \\ 1 \end{pmatrix} 
= \frac{1}{8}>0,
$$
因此判别为第一组。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\end{enumerate}

}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %8 第六章：聚类分析：6.3. 系统聚类法：第185页：例子6.3.2.
设有四个样品，每个样品只测量了一个指标，分别是 $1,2,6,8$. 
定义类与类之间的距离为所有样品对之间的平均距离，距离定义为指标的差的绝对值。
使用类平均法进行聚类。写出每次聚类得到的距离矩阵。

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]

\item  开始时每个样品 1, 2, 6, 8 成为一类，计算两两之间的距离，得到 
\dotfill (\underline{\hspace{0.2cm} 4分 \hspace{0.2cm}})
$$D_{(0)} = \begin{pmatrix} 0&1&5&7 \\ 1&0&4&6 \\ 5&4&0&2 \\ 7&6&2&0 \end{pmatrix}. $$

\item  找出矩阵 $D_{(0)}$ 的对角线之外的最小元素，为 $(1,2)$ 元素和 $(2,1)$ 元素。因此将这两个元素合并为一类，得到
$\{1, 2\}, 6, 8$. 然后计算这三类之间的两两平均距离，得到
\dotfill (\underline{\hspace{0.2cm} 4分 \hspace{0.2cm}})
$$D_{(1)} = \begin{pmatrix} 0&\frac{9}{2}&\frac{13}{2} \\ \frac{9}{2}&0&2 \\ \frac{13}{2}&2&0 \end{pmatrix}. $$

\item  找出矩阵 $D_{(1)}$ 的对角线之外的最小元素，为 $(2,3)$ 元素和 $(3,2)$ 元素。因此将这两个元素合并为一类，得到
$\{1, 2\}, \{6, 8\}$. 然后计算这两类之间的平均距离，得到
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})
$$D_{(2)} = \begin{pmatrix} 0&\frac{11}{2} \\ \frac{11}{2}&0 \end{pmatrix}. $$


\item  最后将这两类合并，得到一类 $\{ \{1, 2\}, \{6, 8\} \}$. 

\end{enumerate}

}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %9 第七章：主成分分析：7.3.样本的主成分：第226页：一、样本主成分的定义
设 $x=(x_1,\cdots,x_p)^t$ 是一个 $p$ 维随机向量。
设 $\vec{x}_1,\cdots,\vec{x}_n$ 是一个样本，其中每个 $\vec{x}_i$ 都是一个 $p$ 维列向量。
%记 $X=(\vec{x}_1,\cdots, \vec{x}_n)^t = (x_{ij})_{n\times p}$ 为数据矩阵。
写出第一样本主成分和第二样本主成分的计算思路。

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]

\item  首先计算样本均值和样本协方差矩阵，
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})
$$
\vec{m} = \frac{1}{n} \sum\limits_{i=1}^{n} \vec{x}_i, \,\, 
S= \frac{1}{n-1} \sum\limits_{i=1}^{n} (\vec{x}_i - \vec{m}) (\vec{x}_i - \vec{m})^t. 
$$

\item  设第一主成分为 $y_1=a_1^tx$, 其中 $a_1=(a_{11},\cdots,a_{p1})^t$ 为权重向量，其约束条件为 $\lVert a_1 \rVert =1$, 且对应的样本值 $a_1^t\vec{x}_1, \cdots, a_1^t\vec{x}_n$ 的样本方差达到最大。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  第一主成分的样本值的样本方差为下述二次型，
$$
\frac{1}{n-1} \sum\limits_{i=1}^{n} (a_1^t\vec{x}_1-\vec{m})^2 = a_1^tSa_1. 
$$
因此取 $a_1$ 为 $S$ 的最大特征值的单位特征向量，可使该二次型的值达到最大。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  设第二主成分为 $y_2=a_2^tx$, 其中 $a_2=(a_{12},\cdots,a_{p2})^t$ 为权重向量，其约束条件为 $\lVert a_2 \rVert =1$, 以及对应的样本值 $a_2^t\vec{x}_1, \cdots, a_2^t\vec{x}_n$ 与第一主成分的样本值的样本协方差为零。在这两个约束条件下，第二主成分的样本方差要达到最大。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  第一第二主成分的样本协方差为 $a_1^tSa_2$, 第二主成分的样本方差为 $a_2^tSa_2$. 因此取 $a_2$ 为 $S$ 的第二大特征值的单位特征向量。 
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\end{enumerate}

}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\newpage 
\item %10 第八章：因子分析：8.2. 正交因子模型：第255页：三、因子载荷矩阵的统计意义
考虑正交因子模型 $x=\mu +Af+\varepsilon$ 的因子载荷矩阵 $A$ 的统计意义。
给出矩阵 $A$ 的元素的含义、行元素平方和的含义、列元素平方和的含义、以及所有元素的平方和的含义。

%%\vspace{0.2cm}

{\color{red}解答：
\begin{enumerate}[label=(\arabic*)]
\item  因为 $\mathrm{cov}(x,f) = \mathrm{cov}(\mu +Af+\varepsilon, f) = \mathrm{cov}(Af,f) = A$, 
所以 $\mathrm{cov}(x_i,f_j) = a_{ij}$, 表示原始变量 $x_i$ 与因子 $f_j$ 之间的协方差。如果原始变量已经标准化，即方差为1，因为因子的方差已经假定为1，所以此时 $a_{ij}$ 也表示原始变量 $x_i$ 与因子 $f_j$ 之间的相关系数。
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})

\item  正交因子模型的第 $i$ 行为 $x_i = \mu_i + a_{i1}f_1+\cdots+a_{im}f_m+\varepsilon_i$. 两边求方差，可得
$V(x_i) = a_{i1}^2 + \cdots + a_{im}^2 + \sigma^2$. 因此载荷矩阵的第 $i$ 行元素的平方和表示所有公共因子对原始变量 $x_i$ 的方差贡献。
\dotfill (\underline{\hspace{0.2cm} 3分 \hspace{0.2cm}})

\item  载荷矩阵的第 $j$ 列元素的平方和表示第 $j$ 个公共因子 $f_j$ 对所有原始变量的总方差贡献。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\item  载荷矩阵的所有元素的平方和表示所有公共因子对所有原始变量的总方差贡献。
\dotfill (\underline{\hspace{0.2cm} 2分 \hspace{0.2cm}})

\end{enumerate}

}

%%\vspace{0.2cm}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%



%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

\end{enumerate}

\end{document}





